library(summarytools)
library(tidyverse)
## -- Attaching core tidyverse packages ------------------------ tidyverse 2.0.0 --
## v dplyr     1.1.2     v readr     2.1.4
## v forcats   1.0.0     v stringr   1.5.0
## v ggplot2   3.4.2     v tibble    3.2.1
## v lubridate 1.9.2     v tidyr     1.3.0
## v purrr     1.0.1     
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
## x tibble::view()  masks summarytools::view()
## i Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggthemes)
library(haven)
Base_Trajipaq_Finale_Ok <- read_dta("~/Desktop/Base_Trajipaq_Finale_Ok.dta")

Présentation des variables

Variables de contrôle

Sexe

# Q10 = êtes-vous un homme, une femme ou autre (précisez) ?

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(SEXE = case_when(
    Q10 == 1 ~ "Homme",
    Q10 == 2 ~ "Femme",
    Q10 == 97 ~ "Autre"
  ))
freq(Base_Trajipaq_Finale_Ok$SEXE)
## Frequencies  
## Base_Trajipaq_Finale_Ok$SEXE  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##       Femme    886     56.69          56.69     56.69          56.69
##       Homme    677     43.31         100.00     43.31         100.00
##        <NA>      0                               0.00         100.00
##       Total   1563    100.00         100.00    100.00         100.00
ggplot(data = Base_Trajipaq_Finale_Ok, mapping = aes(x = SEXE)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du sexe",
    x = "Sexe"
       ) +
  coord_flip() +
  theme_bw()

Âge

# QAGE = à quel groupe d'âge appartenez-vous ?

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(AGE = case_when(
    QAGE == 1 ~ "[0;19]",
    QAGE == 2 ~ "[20;24]",
    QAGE == 3 ~ "[25;29]",
    QAGE == 4 ~ "[30;34]",
    QAGE == 5 ~ "[35;39]",
    QAGE == 6 ~ "[40;44]",
    QAGE == 7 ~ "[45;49]",
    QAGE == 8 ~ "[50;60]",
    QAGE == 9 ~ "[61;99]",
    QAGE == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok$AGE <- factor(Base_Trajipaq_Finale_Ok$AGE,levels = c(
  "[0;19]",
  "[20;24]",
  "[25;29]",
  "[30;34]",
  "[35;39]",
  "[40;44]",
  "[45;49]",
  "[50;60]",
  "[61;99]",
  NA
), ordered = TRUE)
freq(Base_Trajipaq_Finale_Ok$AGE)
## Frequencies  
## Base_Trajipaq_Finale_Ok$AGE  
## Type: Ordered Factor  
## 
##                 Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------- ------ --------- -------------- --------- --------------
##        [0;19]      0      0.00           0.00      0.00           0.00
##       [20;24]     76      4.86           4.86      4.86           4.86
##       [25;29]    136      8.70          13.56      8.70          13.56
##       [30;34]    259     16.57          30.13     16.57          30.13
##       [35;39]    385     24.63          54.77     24.63          54.77
##       [40;44]    328     20.99          75.75     20.99          75.75
##       [45;49]    182     11.64          87.40     11.64          87.40
##       [50;60]    125      8.00          95.39      8.00          95.39
##       [61;99]     72      4.61         100.00      4.61         100.00
##          <NA>      0                               0.00         100.00
##         Total   1563    100.00         100.00    100.00         100.00
ggplot(data = Base_Trajipaq_Finale_Ok, mapping = aes(x = AGE)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution de l'age par groupes",
    x = "Age en annees"
       ) +
  coord_flip() +
  theme_bw()

Education

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(EDUCATION = case_when(
    Q26 == 1 ~ "Elementaire",
    Q26 == 2 ~ "Secondaire",
    Q26 == 3 ~ "Collegial",
    Q26 == 4 ~ "Post secondaire",
    Q26 == 5 ~ "Universitaire",
    Q26 == 6 ~ NA,
    Q26 == 98 ~ NA,
    Q26 == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok$EDUCATION <- factor(Base_Trajipaq_Finale_Ok$EDUCATION,levels = c(
  "Elementaire",
  "Secondaire",
  "Post secondaire",
  "Collegial",
  "Universitaire",
  NA
), ordered = TRUE)
freq(Base_Trajipaq_Finale_Ok$EDUCATION)
## Frequencies  
## Base_Trajipaq_Finale_Ok$EDUCATION  
## Type: Ordered Factor  
## 
##                         Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## --------------------- ------ --------- -------------- --------- --------------
##           Elementaire    238     16.49          16.49     15.23          15.23
##            Secondaire    355     24.60          41.09     22.71          37.94
##       Post secondaire    196     13.58          54.68     12.54          50.48
##             Collegial    241     16.70          71.38     15.42          65.90
##         Universitaire    413     28.62         100.00     26.42          92.32
##                  <NA>    120                               7.68         100.00
##                 Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(EDUCATION)), aes(x = EDUCATION)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du niveau d'education",
    x = "Niveau d'education"
       ) +
  coord_flip() +
  theme_bw()

Origine

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(ORIGINE = case_when(
    region_naissance == "ANMO" ~ "Afrique du Nord et Moyen Orient",
    region_naissance == "ACAS" ~ "Amerique centrale et Amerique su Sud",
    region_naissance == "Afrique subsaharienne" ~ "Afrique subsaharienne",
    region_naissance == "Asie" ~ "Asie",
    region_naissance == "Autres" ~ "Autres",
    region_naissance == "Canada" ~ "Canada",
    region_naissance == "Caraibes" ~ "Caraibes",
    region_naissance == "Europe" ~ "Europe",
    region_naissance == "France" ~ "France",
    region_naissance == "NSP" ~ NA,
  ))
freq(Base_Trajipaq_Finale_Ok$ORIGINE)
## Frequencies  
## Base_Trajipaq_Finale_Ok$ORIGINE  
## Type: Character  
## 
##                                              Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------------------------------------ ------ --------- -------------- --------- --------------
##            Afrique du Nord et Moyen Orient    239     16.70          16.70     15.29          15.29
##       Amerique centrale et Amerique su Sud    119      8.32          25.02      7.61          22.90
##                                       Asie     96      6.71          31.73      6.14          29.05
##                                     Autres     24      1.68          33.40      1.54          30.58
##                                     Canada    454     31.73          65.13     29.05          59.63
##                                   Caraibes     54      3.77          68.90      3.45          63.08
##                                     Europe    148     10.34          79.25      9.47          72.55
##                                     France    297     20.75         100.00     19.00          91.55
##                                       <NA>    132                               8.45         100.00
##                                      Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(ORIGINE)), aes(x = ORIGINE)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution de l'origine par region",
    x = "Region"
       ) +
  coord_flip() +
  theme_bw()

Revenu

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(REVENU = case_when(
    Q100 == 1 ~ "[0 ; 19 999]",
    Q100 == 2 ~ "[0 ; 19 999]",
    Q100 == 3 ~ "[20 000 ; 39 999]",
    Q100 == 4 ~ "[20 000 ; 39 999]",
    Q100 == 5 ~ "[40 000 ; 59 999]",
    Q100 == 6 ~ "[40 000 ; 59 999]",
    Q100 == 7 ~ "[60 000 ; 79 999]",
    Q100 == 8 ~ "[60 000 ; 79 999]",
    Q100 == 9 ~ "[80 000 ; 99 999]",
    Q100 == 10 ~ "[90 000 ; 99 999]",
    Q100 == 11 ~ "[100 000 ; 149 999]",
    Q100 == 12 ~ "[150 000 et plus]",
    Q100 == 98 ~ NA,
    Q100 == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok$REVENU <- factor(Base_Trajipaq_Finale_Ok$REVENU,levels = c(
  "[0 ; 19 999]",
  "[20 000 ; 39 999]",
  "[40 000 ; 59 999]",
  "[60 000 ; 79 999]",
  "[80 000 ; 99 999]",
  "[100 000 ; 149 999]",
  "[150 000 et plus]",
  NA
), ordered = TRUE)
freq(Base_Trajipaq_Finale_Ok$REVENU)
## Frequencies  
## Base_Trajipaq_Finale_Ok$REVENU  
## Type: Ordered Factor  
## 
##                             Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------------------- ------ --------- -------------- --------- --------------
##              [0 ; 19 999]    169     13.07          13.07     10.81          10.81
##         [20 000 ; 39 999]    250     19.33          32.41     15.99          26.81
##         [40 000 ; 59 999]    351     27.15          59.55     22.46          49.26
##         [60 000 ; 79 999]    239     18.48          78.04     15.29          64.56
##         [80 000 ; 99 999]     90      6.96          85.00      5.76          70.31
##       [100 000 ; 149 999]    151     11.68          96.67      9.66          79.97
##         [150 000 et plus]     43      3.33         100.00      2.75          82.73
##                      <NA>    270                              17.27         100.00
##                     Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(REVENU)), aes(x = REVENU)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du revenu par groupes",
    x = "Revenu"
       ) +
  coord_flip() +
  theme_bw()

Langue maternelle

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(LANGUE = case_when(
    Q20M1 == 1 ~ "Francais",
    Q20M1 == 2 ~ "Anglais",
    Q20M1 == 97 ~ "Autre",
    Q20M1 == 98 ~ NA,
    Q20M1 == 99 ~ NA
  ))
freq(Base_Trajipaq_Finale_Ok$LANGUE)
## Frequencies  
## Base_Trajipaq_Finale_Ok$LANGUE  
## Type: Character  
## 
##                  Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## -------------- ------ --------- -------------- --------- --------------
##        Anglais    129      8.34           8.34      8.25           8.25
##          Autre    430     27.81          36.16     27.51          35.76
##       Francais    987     63.84         100.00     63.15          98.91
##           <NA>     17                               1.09         100.00
##          Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(LANGUE)), aes(x = LANGUE)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution de la langue maternelle",
    x = "Langue maternelle"
       ) +
  coord_flip() +
  theme_bw()

Religion

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(RELIGION = case_when(
    Q17 == 0 ~ "Sans religion",
    Q17 == 1 ~ "Catholique",
    Q17 == 2 ~ "Protestante",
    Q17 == 3 ~ "Autres Chretiens",
    Q17 == 4 ~ "Autres Chretiens",
    Q17 == 5 ~ "Autres Chretiens",
    Q17 == 6 ~ "Orthodoxe",
    Q17 == 7 ~ "Autres Chretiens",
    Q17 == 8 ~ "Musulmans",
    Q17 == 9 ~ "Autre",
    Q17 == 10 ~ "Autre",
    Q17 == 11 ~ "Autre",
    Q17 == 12 ~ "Autre",
    Q17 == 97 ~ "Autre",
    Q17 == 98 ~ NA,
    Q17 == 99 ~ NA
  ))
freq(Base_Trajipaq_Finale_Ok$RELIGION)
## Frequencies  
## Base_Trajipaq_Finale_Ok$RELIGION  
## Type: Character  
## 
##                          Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ---------------------- ------ --------- -------------- --------- --------------
##                  Autre     89      5.86           5.86      5.69           5.69
##       Autres Chretiens     47      3.10           8.96      3.01           8.70
##             Catholique    489     32.21          41.17     31.29          39.99
##              Musulmans    210     13.83          55.01     13.44          53.42
##              Orthodoxe     89      5.86          60.87      5.69          59.12
##            Protestante     42      2.77          63.64      2.69          61.80
##          Sans religion    552     36.36         100.00     35.32          97.12
##                   <NA>     45                               2.88         100.00
##                  Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(RELIGION)), aes(x = RELIGION)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution de la religion",
    x = "Religion"
       ) +
  coord_flip() +
  theme_bw()

Statut matrimonial

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(MATRIMONIAL = case_when(
    STATUT == 1 ~ "Celibataire",
    STATUT == 2 ~ "Marie(e)",
    STATUT == 3 ~ "Conjoint(e) de fait",
    STATUT == 4 ~ "Separe(e)",
    STATUT == 5 ~ "Divorce(e)",
    STATUT == 6 ~ "Veuf(ve)"
  ))
freq(Base_Trajipaq_Finale_Ok$MATRIMONIAL)
## Frequencies  
## Base_Trajipaq_Finale_Ok$MATRIMONIAL  
## Type: Character  
## 
##                             Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------------------- ------ --------- -------------- --------- --------------
##               Celibataire    363     24.26          24.26     23.22          23.22
##       Conjoint(e) de fait    331     22.13          46.39     21.18          44.40
##                Divorce(e)     46      3.07          49.47      2.94          47.34
##                  Marie(e)    711     47.53          96.99     45.49          92.83
##                 Separe(e)     39      2.61          99.60      2.50          95.33
##                  Veuf(ve)      6      0.40         100.00      0.38          95.71
##                      <NA>     67                               4.29         100.00
##                     Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(MATRIMONIAL)), aes(x = MATRIMONIAL)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du statut matrimonial",
    x = "Statut matrimonial"
       ) +
  coord_flip() +
  theme_bw()

Variables dépendantes

VD1 : sentiment d’appartenance au Québec

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q39A = case_when(
    Q39A == 1 ~ 4,
    Q39A == 2 ~ 3,
    Q39A == 3 ~ 2,
    Q39A == 4 ~ 1,
    Q39A == 98 ~ NA,
    Q39A == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q39B = case_when(
    Q39B == 1 ~ 4,
    Q39B == 2 ~ 3,
    Q39B == 3 ~ 2,
    Q39B == 4 ~ 1,
    Q39B == 98 ~ NA,
    Q39B == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q39C = case_when(
    Q39C == 1 ~ 4,
    Q39C == 2 ~ 3,
    Q39C == 3 ~ 2,
    Q39C == 4 ~ 1,
    Q39C == 98 ~ NA,
    Q39C == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q39D = case_when(
    Q39D == 1 ~ 4,
    Q39D == 2 ~ 3,
    Q39D == 3 ~ 2,
    Q39D == 4 ~ 1,
    Q39D == 98 ~ NA,
    Q39D == 99 ~ NA
  ))
v_VD1 <- c(
  "Q39A",
  "Q39B",
  "Q39C",
  "Q39D"
)

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  rowwise() %>%
  mutate(VD1 = (sum(c_across(all_of(v_VD1)), na.rm = TRUE) - length(v_VD1)) / (3*length(v_VD1))) %>%
  mutate(VD1 = if (VD1 < 0) NA_real_ else VD1) %>%
  ungroup()
descr(Base_Trajipaq_Finale_Ok$VD1)
## Descriptive Statistics  
## Base_Trajipaq_Finale_Ok$VD1  
## N: 1563  
## 
##                         VD1
## ----------------- ---------
##              Mean      0.53
##           Std.Dev      0.24
##               Min      0.00
##                Q1      0.33
##            Median      0.50
##                Q3      0.75
##               Max      1.00
##               MAD      0.25
##               IQR      0.42
##                CV      0.45
##          Skewness     -0.20
##       SE.Skewness      0.06
##          Kurtosis     -0.78
##           N.Valid   1540.00
##         Pct.Valid     98.53
ggplot(data = Base_Trajipaq_Finale_Ok, mapping = aes(x = VD1)) +
  geom_histogram(na.rm = TRUE, fill = "pink", binwidth = 0.01) +
  labs(
    title = "Distribution du sentiment d'appartenance au Quebec",
    x = "Indice du sentiment d'appartenance au Quebec"
       ) +
  theme_bw()

VD2 : sentiment d’appartenance (Canada)

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(VD2 = case_when(
    Q39E == 1 ~ "Oui",
    Q39E == 2 ~ "Oui",
    Q39E == 3 ~ "Non",
    Q39E == 4 ~ "Non",
    Q39E == 98 ~ NA,
    Q39E == 99 ~ NA
  ))
freq(Base_Trajipaq_Finale_Ok$VD2)
## Frequencies  
## Base_Trajipaq_Finale_Ok$VD2  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##         Non    271     17.82          17.82     17.34          17.34
##         Oui   1250     82.18         100.00     79.97          97.31
##        <NA>     42                               2.69         100.00
##       Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(VD2)), aes(x = VD2)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du sentiment d'appartenance au Canada",
    x = "Sentiment d'appartenance au Canada"
       ) +
  coord_flip() +
  theme_bw()

VD3 : sentiment d’appartenance au pays d’origine

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(VD3 = case_when(
    Q39F == 1 ~ "Oui",
    Q39F == 2 ~ "Oui",
    Q39F == 3 ~ "Non",
    Q39F == 4 ~ "Non",
    Q39F == 98 ~ NA,
    Q39F == 99 ~ NA
  ))
freq(Base_Trajipaq_Finale_Ok$VD3)
## Frequencies  
## Base_Trajipaq_Finale_Ok$VD3  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##         Non    280     18.58          18.58     17.91          17.91
##         Oui   1227     81.42         100.00     78.50          96.42
##        <NA>     56                               3.58         100.00
##       Total   1563    100.00         100.00    100.00         100.00
ggplot(subset(Base_Trajipaq_Finale_Ok, !is.na(VD3)), aes(x = VD3)) +
  geom_bar(fill = "pink") +
  labs(
    title = "Distribution du sentiment d'appartenance au pays d'origine",
    x = "Sentiment d'appartenance au pays d'origine"
       ) +
  coord_flip() +
  theme_bw()

Variables indépendantes

VI4 : discrimination subie au cours des 12 derniers mois

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q40A = case_when(
    Q40A == 1 ~ 3,
    Q40A == 2 ~ 2,
    Q40A == 3 ~ 1,
    Q40A == 96 ~ NA,
    Q40A == 98 ~ NA,
    Q40A == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q40B = case_when(
    Q40B == 1 ~ 3,
    Q40B == 2 ~ 2,
    Q40B == 3 ~ 1,
    Q40B == 96 ~ NA,
    Q40B == 98 ~ NA,
    Q40B == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q40C = case_when(
    Q40C == 1 ~ 3,
    Q40C == 2 ~ 2,
    Q40C == 3 ~ 1,
    Q40C == 96 ~ NA,
    Q40C == 98 ~ NA,
    Q40C == 99 ~ NA
  ))

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(Q40D = case_when(
    Q40D == 1 ~ 3,
    Q40D == 2 ~ 2,
    Q40D == 3 ~ 1,
    Q40D == 96 ~ NA,
    Q40D == 98 ~ NA,
    Q40D == 99 ~ NA
  ))
v_VI4 <- c(
  "Q40A",
  "Q40B",
  "Q40C",
  "Q39D"
  )

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  rowwise() %>%
  mutate(VI4 = (sum(c_across(all_of(v_VI4)), na.rm = TRUE) - length(v_VI4)) / (2.25*length(v_VI4))) %>%
  mutate(VI4 = if (VI4 < 0) NA_real_ else VI4) %>%
  ungroup()
descr(Base_Trajipaq_Finale_Ok$VI4)
## Descriptive Statistics  
## Base_Trajipaq_Finale_Ok$VI4  
## N: 1563  
## 
##                         VI4
## ----------------- ---------
##              Mean      0.27
##           Std.Dev      0.17
##               Min      0.00
##                Q1      0.11
##            Median      0.22
##                Q3      0.33
##               Max      1.00
##               MAD      0.16
##               IQR      0.22
##                CV      0.64
##          Skewness      0.94
##       SE.Skewness      0.06
##          Kurtosis      2.17
##           N.Valid   1440.00
##         Pct.Valid     92.13
ggplot(data = Base_Trajipaq_Finale_Ok, mapping = aes(x = VI4)) +
  geom_histogram(na.rm = TRUE, fill = "pink", binwidth = 0.01) +
  labs(
    title = "Distribution de la discrimination subie au cours des 12 derniers mois",
    x = "Indice de la discrimination subie au cours des 12 derniers mois"
       ) +
  theme_bw()

Analyse

H1 : VD1 entretient une relation négative avec VI4

Modèle de régression

reg_1 <- lm(Base_Trajipaq_Finale_Ok$VI4 ~ Base_Trajipaq_Finale_Ok$VD1 +
              Base_Trajipaq_Finale_Ok$SEXE +
              Base_Trajipaq_Finale_Ok$AGE +
              Base_Trajipaq_Finale_Ok$EDUCATION +
              Base_Trajipaq_Finale_Ok$ORIGINE +
              Base_Trajipaq_Finale_Ok$REVENU +
              Base_Trajipaq_Finale_Ok$LANGUE +
              Base_Trajipaq_Finale_Ok$RELIGION +
              Base_Trajipaq_Finale_Ok$MATRIMONIAL
            )
summary(reg_1)
## 
## Call:
## lm(formula = Base_Trajipaq_Finale_Ok$VI4 ~ Base_Trajipaq_Finale_Ok$VD1 + 
##     Base_Trajipaq_Finale_Ok$SEXE + Base_Trajipaq_Finale_Ok$AGE + 
##     Base_Trajipaq_Finale_Ok$EDUCATION + Base_Trajipaq_Finale_Ok$ORIGINE + 
##     Base_Trajipaq_Finale_Ok$REVENU + Base_Trajipaq_Finale_Ok$LANGUE + 
##     Base_Trajipaq_Finale_Ok$RELIGION + Base_Trajipaq_Finale_Ok$MATRIMONIAL)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.56109 -0.08475 -0.01654  0.05991  0.72808 
## 
## Coefficients:
##                                                                       Estimate
## (Intercept)                                                          6.330e-02
## Base_Trajipaq_Finale_Ok$VD1                                          3.924e-01
## Base_Trajipaq_Finale_Ok$SEXEHomme                                    1.400e-02
## Base_Trajipaq_Finale_Ok$AGE.L                                        2.563e-02
## Base_Trajipaq_Finale_Ok$AGE.Q                                       -3.304e-02
## Base_Trajipaq_Finale_Ok$AGE.C                                        1.932e-02
## Base_Trajipaq_Finale_Ok$AGE^4                                       -2.840e-02
## Base_Trajipaq_Finale_Ok$AGE^5                                        1.928e-02
## Base_Trajipaq_Finale_Ok$AGE^6                                        2.051e-03
## Base_Trajipaq_Finale_Ok$AGE^7                                       -2.090e-03
## Base_Trajipaq_Finale_Ok$EDUCATION.L                                  2.157e-02
## Base_Trajipaq_Finale_Ok$EDUCATION.Q                                  1.461e-02
## Base_Trajipaq_Finale_Ok$EDUCATION.C                                 -2.149e-02
## Base_Trajipaq_Finale_Ok$EDUCATION^4                                 -2.141e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAmerique centrale et Amerique su Sud  4.344e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAsie                                  5.762e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAutres                                1.716e-02
## Base_Trajipaq_Finale_Ok$ORIGINECanada                               -3.062e-02
## Base_Trajipaq_Finale_Ok$ORIGINECaraibes                              5.712e-02
## Base_Trajipaq_Finale_Ok$ORIGINEEurope                               -1.881e-02
## Base_Trajipaq_Finale_Ok$ORIGINEFrance                               -3.528e-02
## Base_Trajipaq_Finale_Ok$REVENU.L                                    -4.929e-02
## Base_Trajipaq_Finale_Ok$REVENU.Q                                    -1.630e-03
## Base_Trajipaq_Finale_Ok$REVENU.C                                    -3.532e-03
## Base_Trajipaq_Finale_Ok$REVENU^4                                    -2.741e-02
## Base_Trajipaq_Finale_Ok$REVENU^5                                     4.314e-03
## Base_Trajipaq_Finale_Ok$REVENU^6                                    -1.794e-02
## Base_Trajipaq_Finale_Ok$LANGUEAutre                                 -3.379e-02
## Base_Trajipaq_Finale_Ok$LANGUEFrancais                              -2.808e-05
## Base_Trajipaq_Finale_Ok$RELIGIONAutres Chretiens                    -1.013e-02
## Base_Trajipaq_Finale_Ok$RELIGIONCatholique                          -8.276e-03
## Base_Trajipaq_Finale_Ok$RELIGIONMusulmans                            5.495e-02
## Base_Trajipaq_Finale_Ok$RELIGIONOrthodoxe                            3.240e-02
## Base_Trajipaq_Finale_Ok$RELIGIONProtestante                         -3.674e-03
## Base_Trajipaq_Finale_Ok$RELIGIONSans religion                       -2.176e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALConjoint(e) de fait              -9.689e-03
## Base_Trajipaq_Finale_Ok$MATRIMONIALDivorce(e)                        3.776e-03
## Base_Trajipaq_Finale_Ok$MATRIMONIALMarie(e)                          1.126e-03
## Base_Trajipaq_Finale_Ok$MATRIMONIALSepare(e)                        -3.018e-04
## Base_Trajipaq_Finale_Ok$MATRIMONIALVeuf(ve)                          1.392e-01
##                                                                     Std. Error
## (Intercept)                                                          3.536e-02
## Base_Trajipaq_Finale_Ok$VD1                                          2.658e-02
## Base_Trajipaq_Finale_Ok$SEXEHomme                                    9.987e-03
## Base_Trajipaq_Finale_Ok$AGE.L                                        2.282e-02
## Base_Trajipaq_Finale_Ok$AGE.Q                                        1.973e-02
## Base_Trajipaq_Finale_Ok$AGE.C                                        1.798e-02
## Base_Trajipaq_Finale_Ok$AGE^4                                        1.724e-02
## Base_Trajipaq_Finale_Ok$AGE^5                                        1.586e-02
## Base_Trajipaq_Finale_Ok$AGE^6                                        1.392e-02
## Base_Trajipaq_Finale_Ok$AGE^7                                        1.129e-02
## Base_Trajipaq_Finale_Ok$EDUCATION.L                                  1.163e-02
## Base_Trajipaq_Finale_Ok$EDUCATION.Q                                  1.161e-02
## Base_Trajipaq_Finale_Ok$EDUCATION.C                                  1.103e-02
## Base_Trajipaq_Finale_Ok$EDUCATION^4                                  1.197e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAmerique centrale et Amerique su Sud  2.579e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAsie                                  2.701e-02
## Base_Trajipaq_Finale_Ok$ORIGINEAutres                                4.610e-02
## Base_Trajipaq_Finale_Ok$ORIGINECanada                                2.283e-02
## Base_Trajipaq_Finale_Ok$ORIGINECaraibes                              3.452e-02
## Base_Trajipaq_Finale_Ok$ORIGINEEurope                                2.432e-02
## Base_Trajipaq_Finale_Ok$ORIGINEFrance                                2.273e-02
## Base_Trajipaq_Finale_Ok$REVENU.L                                     1.869e-02
## Base_Trajipaq_Finale_Ok$REVENU.Q                                     1.765e-02
## Base_Trajipaq_Finale_Ok$REVENU.C                                     1.606e-02
## Base_Trajipaq_Finale_Ok$REVENU^4                                     1.368e-02
## Base_Trajipaq_Finale_Ok$REVENU^5                                     1.379e-02
## Base_Trajipaq_Finale_Ok$REVENU^6                                     1.284e-02
## Base_Trajipaq_Finale_Ok$LANGUEAutre                                  2.078e-02
## Base_Trajipaq_Finale_Ok$LANGUEFrancais                               2.073e-02
## Base_Trajipaq_Finale_Ok$RELIGIONAutres Chretiens                     3.918e-02
## Base_Trajipaq_Finale_Ok$RELIGIONCatholique                           2.310e-02
## Base_Trajipaq_Finale_Ok$RELIGIONMusulmans                            2.878e-02
## Base_Trajipaq_Finale_Ok$RELIGIONOrthodoxe                            3.219e-02
## Base_Trajipaq_Finale_Ok$RELIGIONProtestante                          3.856e-02
## Base_Trajipaq_Finale_Ok$RELIGIONSans religion                        2.230e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALConjoint(e) de fait               1.474e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALDivorce(e)                        3.051e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALMarie(e)                          1.393e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALSepare(e)                         2.951e-02
## Base_Trajipaq_Finale_Ok$MATRIMONIALVeuf(ve)                          7.692e-02
##                                                                     t value
## (Intercept)                                                           1.790
## Base_Trajipaq_Finale_Ok$VD1                                          14.762
## Base_Trajipaq_Finale_Ok$SEXEHomme                                     1.402
## Base_Trajipaq_Finale_Ok$AGE.L                                         1.123
## Base_Trajipaq_Finale_Ok$AGE.Q                                        -1.674
## Base_Trajipaq_Finale_Ok$AGE.C                                         1.075
## Base_Trajipaq_Finale_Ok$AGE^4                                        -1.647
## Base_Trajipaq_Finale_Ok$AGE^5                                         1.215
## Base_Trajipaq_Finale_Ok$AGE^6                                         0.147
## Base_Trajipaq_Finale_Ok$AGE^7                                        -0.185
## Base_Trajipaq_Finale_Ok$EDUCATION.L                                   1.855
## Base_Trajipaq_Finale_Ok$EDUCATION.Q                                   1.258
## Base_Trajipaq_Finale_Ok$EDUCATION.C                                  -1.948
## Base_Trajipaq_Finale_Ok$EDUCATION^4                                  -1.789
## Base_Trajipaq_Finale_Ok$ORIGINEAmerique centrale et Amerique su Sud   1.685
## Base_Trajipaq_Finale_Ok$ORIGINEAsie                                   2.133
## Base_Trajipaq_Finale_Ok$ORIGINEAutres                                 0.372
## Base_Trajipaq_Finale_Ok$ORIGINECanada                                -1.341
## Base_Trajipaq_Finale_Ok$ORIGINECaraibes                               1.654
## Base_Trajipaq_Finale_Ok$ORIGINEEurope                                -0.773
## Base_Trajipaq_Finale_Ok$ORIGINEFrance                                -1.552
## Base_Trajipaq_Finale_Ok$REVENU.L                                     -2.638
## Base_Trajipaq_Finale_Ok$REVENU.Q                                     -0.092
## Base_Trajipaq_Finale_Ok$REVENU.C                                     -0.220
## Base_Trajipaq_Finale_Ok$REVENU^4                                     -2.003
## Base_Trajipaq_Finale_Ok$REVENU^5                                      0.313
## Base_Trajipaq_Finale_Ok$REVENU^6                                     -1.398
## Base_Trajipaq_Finale_Ok$LANGUEAutre                                  -1.626
## Base_Trajipaq_Finale_Ok$LANGUEFrancais                               -0.001
## Base_Trajipaq_Finale_Ok$RELIGIONAutres Chretiens                     -0.259
## Base_Trajipaq_Finale_Ok$RELIGIONCatholique                           -0.358
## Base_Trajipaq_Finale_Ok$RELIGIONMusulmans                             1.909
## Base_Trajipaq_Finale_Ok$RELIGIONOrthodoxe                             1.006
## Base_Trajipaq_Finale_Ok$RELIGIONProtestante                          -0.095
## Base_Trajipaq_Finale_Ok$RELIGIONSans religion                        -0.976
## Base_Trajipaq_Finale_Ok$MATRIMONIALConjoint(e) de fait               -0.657
## Base_Trajipaq_Finale_Ok$MATRIMONIALDivorce(e)                         0.124
## Base_Trajipaq_Finale_Ok$MATRIMONIALMarie(e)                           0.081
## Base_Trajipaq_Finale_Ok$MATRIMONIALSepare(e)                         -0.010
## Base_Trajipaq_Finale_Ok$MATRIMONIALVeuf(ve)                           1.810
##                                                                     Pr(>|t|)
## (Intercept)                                                          0.07370
## Base_Trajipaq_Finale_Ok$VD1                                          < 2e-16
## Base_Trajipaq_Finale_Ok$SEXEHomme                                    0.16131
## Base_Trajipaq_Finale_Ok$AGE.L                                        0.26164
## Base_Trajipaq_Finale_Ok$AGE.Q                                        0.09440
## Base_Trajipaq_Finale_Ok$AGE.C                                        0.28276
## Base_Trajipaq_Finale_Ok$AGE^4                                        0.09989
## Base_Trajipaq_Finale_Ok$AGE^5                                        0.22454
## Base_Trajipaq_Finale_Ok$AGE^6                                        0.88288
## Base_Trajipaq_Finale_Ok$AGE^7                                        0.85317
## Base_Trajipaq_Finale_Ok$EDUCATION.L                                  0.06394
## Base_Trajipaq_Finale_Ok$EDUCATION.Q                                  0.20858
## Base_Trajipaq_Finale_Ok$EDUCATION.C                                  0.05171
## Base_Trajipaq_Finale_Ok$EDUCATION^4                                  0.07399
## Base_Trajipaq_Finale_Ok$ORIGINEAmerique centrale et Amerique su Sud  0.09239
## Base_Trajipaq_Finale_Ok$ORIGINEAsie                                  0.03317
## Base_Trajipaq_Finale_Ok$ORIGINEAutres                                0.70976
## Base_Trajipaq_Finale_Ok$ORIGINECanada                                0.18009
## Base_Trajipaq_Finale_Ok$ORIGINECaraibes                              0.09837
## Base_Trajipaq_Finale_Ok$ORIGINEEurope                                0.43956
## Base_Trajipaq_Finale_Ok$ORIGINEFrance                                0.12106
## Base_Trajipaq_Finale_Ok$REVENU.L                                     0.00849
## Base_Trajipaq_Finale_Ok$REVENU.Q                                     0.92646
## Base_Trajipaq_Finale_Ok$REVENU.C                                     0.82603
## Base_Trajipaq_Finale_Ok$REVENU^4                                     0.04543
## Base_Trajipaq_Finale_Ok$REVENU^5                                     0.75453
## Base_Trajipaq_Finale_Ok$REVENU^6                                     0.16252
## Base_Trajipaq_Finale_Ok$LANGUEAutre                                  0.10432
## Base_Trajipaq_Finale_Ok$LANGUEFrancais                               0.99892
## Base_Trajipaq_Finale_Ok$RELIGIONAutres Chretiens                     0.79602
## Base_Trajipaq_Finale_Ok$RELIGIONCatholique                           0.72021
## Base_Trajipaq_Finale_Ok$RELIGIONMusulmans                            0.05651
## Base_Trajipaq_Finale_Ok$RELIGIONOrthodoxe                            0.31444
## Base_Trajipaq_Finale_Ok$RELIGIONProtestante                          0.92410
## Base_Trajipaq_Finale_Ok$RELIGIONSans religion                        0.32955
## Base_Trajipaq_Finale_Ok$MATRIMONIALConjoint(e) de fait               0.51106
## Base_Trajipaq_Finale_Ok$MATRIMONIALDivorce(e)                        0.90153
## Base_Trajipaq_Finale_Ok$MATRIMONIALMarie(e)                          0.93562
## Base_Trajipaq_Finale_Ok$MATRIMONIALSepare(e)                         0.99184
## Base_Trajipaq_Finale_Ok$MATRIMONIALVeuf(ve)                          0.07063
##                                                                        
## (Intercept)                                                         .  
## Base_Trajipaq_Finale_Ok$VD1                                         ***
## Base_Trajipaq_Finale_Ok$SEXEHomme                                      
## Base_Trajipaq_Finale_Ok$AGE.L                                          
## Base_Trajipaq_Finale_Ok$AGE.Q                                       .  
## Base_Trajipaq_Finale_Ok$AGE.C                                          
## Base_Trajipaq_Finale_Ok$AGE^4                                       .  
## Base_Trajipaq_Finale_Ok$AGE^5                                          
## Base_Trajipaq_Finale_Ok$AGE^6                                          
## Base_Trajipaq_Finale_Ok$AGE^7                                          
## Base_Trajipaq_Finale_Ok$EDUCATION.L                                 .  
## Base_Trajipaq_Finale_Ok$EDUCATION.Q                                    
## Base_Trajipaq_Finale_Ok$EDUCATION.C                                 .  
## Base_Trajipaq_Finale_Ok$EDUCATION^4                                 .  
## Base_Trajipaq_Finale_Ok$ORIGINEAmerique centrale et Amerique su Sud .  
## Base_Trajipaq_Finale_Ok$ORIGINEAsie                                 *  
## Base_Trajipaq_Finale_Ok$ORIGINEAutres                                  
## Base_Trajipaq_Finale_Ok$ORIGINECanada                                  
## Base_Trajipaq_Finale_Ok$ORIGINECaraibes                             .  
## Base_Trajipaq_Finale_Ok$ORIGINEEurope                                  
## Base_Trajipaq_Finale_Ok$ORIGINEFrance                                  
## Base_Trajipaq_Finale_Ok$REVENU.L                                    ** 
## Base_Trajipaq_Finale_Ok$REVENU.Q                                       
## Base_Trajipaq_Finale_Ok$REVENU.C                                       
## Base_Trajipaq_Finale_Ok$REVENU^4                                    *  
## Base_Trajipaq_Finale_Ok$REVENU^5                                       
## Base_Trajipaq_Finale_Ok$REVENU^6                                       
## Base_Trajipaq_Finale_Ok$LANGUEAutre                                    
## Base_Trajipaq_Finale_Ok$LANGUEFrancais                                 
## Base_Trajipaq_Finale_Ok$RELIGIONAutres Chretiens                       
## Base_Trajipaq_Finale_Ok$RELIGIONCatholique                             
## Base_Trajipaq_Finale_Ok$RELIGIONMusulmans                           .  
## Base_Trajipaq_Finale_Ok$RELIGIONOrthodoxe                              
## Base_Trajipaq_Finale_Ok$RELIGIONProtestante                            
## Base_Trajipaq_Finale_Ok$RELIGIONSans religion                          
## Base_Trajipaq_Finale_Ok$MATRIMONIALConjoint(e) de fait                 
## Base_Trajipaq_Finale_Ok$MATRIMONIALDivorce(e)                          
## Base_Trajipaq_Finale_Ok$MATRIMONIALMarie(e)                            
## Base_Trajipaq_Finale_Ok$MATRIMONIALSepare(e)                           
## Base_Trajipaq_Finale_Ok$MATRIMONIALVeuf(ve)                         .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1481 on 933 degrees of freedom
##   (590 observations deleted due to missingness)
## Multiple R-squared:  0.2928, Adjusted R-squared:  0.2633 
## F-statistic: 9.907 on 39 and 933 DF,  p-value: < 2.2e-16
# Le modèle de régression traite les variables d'une manière inattendue.

Coefficient de corrélation

cor.test(Base_Trajipaq_Finale_Ok$VI4, Base_Trajipaq_Finale_Ok$VD1)
## 
##  Pearson's product-moment correlation
## 
## data:  Base_Trajipaq_Finale_Ok$VI4 and Base_Trajipaq_Finale_Ok$VD1
## t = 18.227, df = 1429, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.3913138 0.4754453
## sample estimates:
##       cor 
## 0.4343263

Visualisation

vis_H1 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(SEXE)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_H1)

# La relation est - de manière inattendue - positive.

Sexe

vis_SEXE <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(SEXE)), aes(x = VI4, y = VD1, color = SEXE)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Sexe", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du sexe", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_SEXE)

# La relation semble plus forte chez les femmes avec cette méthode de visualisation.
vis_SEXE_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(SEXE)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du sexe", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ SEXE, nrow = 2) +
  theme_bw()
print(vis_SEXE_2)

# La relation ne semble pas être affectée par le sexe avec cette méthode de visualisation.

Age

vis_AGE <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(AGE)), aes(x = VI4, y = VD1, color = AGE)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Age", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'age", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_AGE)

# La relation semble affectée par l'âge avec cette méthode de visualisation.
vis_AGE_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(AGE)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'age", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ AGE, nrow = 3) +
  theme_bw()
print(vis_AGE_2)

# La relation semble également être affectée par l'âge avec cette méthode de visualisation.

Education

vis_EDUCATION <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(EDUCATION)), aes(x = VI4, y = VD1, color = EDUCATION)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Niveau d'education", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'education", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_EDUCATION)

# La relation semble être affectée par le niveau d'éducation avec cette méthode de visualisation.
vis_EDUCATION_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(EDUCATION)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'education", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ EDUCATION, nrow = 3) +
  theme_bw()
print(vis_EDUCATION_2)

# La relation ne semble pas être affectée par le niveau d'éducation avec cette méthode de visualisation.

Origine

vis_ORIGINE <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(ORIGINE)), aes(x = VI4, y = VD1, color = ORIGINE)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Region d'origine", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'origine", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_ORIGINE)

# La relation semble être affectée par la région d'origine avec cette méthode de visualisation.
vis_ORIGINE_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(ORIGINE)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de l'origine", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ ORIGINE, nrow = 3) +
  theme_bw()
print(vis_ORIGINE_2)

# La relation semble également être affectée avec cette méthode de visualisation.

Revenu

vis_REVENU <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(REVENU)), aes(x = VI4, y = VD1, color = REVENU)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Revenu", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du revenu", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_REVENU)

# La relation semble être affectée par le revenu avec cette méthode de visualisation.
vis_REVENU_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(REVENU)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du revenu", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ REVENU, nrow = 3) +
  theme_bw()
print(vis_REVENU_2)

# La relation semble également être affectée par le revenu avec cette méthode de visualisation.

Langue maternelle

vis_LANGUE <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(LANGUE)), aes(x = VI4, y = VD1, color = LANGUE)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Langue maternelle", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de la langue maternelle", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_LANGUE)

# La relation semble être affectée par la langue maternelle avec cette méthode de visualisation.
vis_LANGUE_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(LANGUE)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de la langue maternelle", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ LANGUE, nrow = 2) +
  theme_bw()
print(vis_LANGUE_2)

# La relation semble être également affectée par la langue maternelle avec cette méthode de visualisation.

Religion

vis_RELIGION <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(RELIGION)), aes(x = VI4, y = VD1, color = RELIGION)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Religion", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de la religion", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_RELIGION)

# La relation semble être affectée par la religion avec cette méthode de visualisation.
vis_RELIGION_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(RELIGION)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction de la religion", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ RELIGION, nrow = 3) +
  theme_bw()
print(vis_RELIGION_2)

# La relation semble être également affectée par la religion avec cette méthode de visualisation.

Statut matrimonial

vis_MATRIMONIAL <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(MATRIMONIAL)), aes(x = VI4, y = VD1, color = MATRIMONIAL)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", formula = "y ~ x", se = FALSE) +
  scale_color_brewer(name = "Statut matrimonial", palette = 1) +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du statut matrimonial", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  theme_bw()
print(vis_MATRIMONIAL)

# La relation semble être affectée par le statut matrimonial avec cette méthode de visualisation.
vis_MATRIMONIAL_2 <- ggplot(Base_Trajipaq_Finale_Ok %>%
                filter(!is.na(VD1), !is.na(VI4), !is.na(MATRIMONIAL)), aes(x = VI4, y = VD1)) +
  geom_jitter(color = "pink") +
  stat_smooth(method = "lm", 
              formula = "y ~ x", 
              se = FALSE,
              color = "purple") +
  labs(title = "Sentiment d'appartenance et discrimination en fonction du statut matrimonial", 
       x = "Discrimination subie au cours des 12 derniers mois", 
       y = "Sentiment d'appartenance au Quebec") +
  facet_wrap(~ MATRIMONIAL, nrow = 3) +
  theme_bw()
print(vis_MATRIMONIAL_2)

# La relation semble être également affectée par le statut matrimonial avec cette méthode de visualisation.

H2 : VD2 entretient une relation négative avec VI4

Modèle de régression

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(VD2_N = case_when(
    VD2 == "Non" ~ 0,
    VD2 == "Oui" ~ 1
  ))
reg_2 <- glm(formula = VD2_N ~ VI4, family = "binomial", data = Base_Trajipaq_Finale_Ok)

summary(reg_2)
## 
## Call:
## glm(formula = VD2_N ~ VI4, family = "binomial", data = Base_Trajipaq_Finale_Ok)
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)   0.9956     0.1294   7.696 1.40e-14 ***
## VI4           2.3216     0.4646   4.997 5.82e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1296.2  on 1418  degrees of freedom
## Residual deviance: 1268.8  on 1417  degrees of freedom
##   (144 observations deleted due to missingness)
## AIC: 1272.8
## 
## Number of Fisher Scoring iterations: 4

Coefficient de corrélation

cor.test(Base_Trajipaq_Finale_Ok$VD2_N, Base_Trajipaq_Finale_Ok$VI4)
## 
##  Pearson's product-moment correlation
## 
## data:  Base_Trajipaq_Finale_Ok$VD2_N and Base_Trajipaq_Finale_Ok$VI4
## t = 5.0581, df = 1417, p-value = 4.789e-07
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.08169993 0.18393586
## sample estimates:
##       cor 
## 0.1331721

Visualisation

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  theme_bw()

# La relation est - de manière inattendue - positive.

Sexe

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction du sexe", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ SEXE, nrow = 2) +
  theme_bw()

# La relation semble être affectée par le sexe.

Age

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction de l'age", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ AGE, nrow = 3) +
  theme_bw()

# La relation semble être affectée par l'âge.

Education

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(EDUCATION)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction de l'education", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ EDUCATION, nrow = 3) +
  theme_bw()

# La relation semble être affectée par le niveau d'éducation.

Origine

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(ORIGINE)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction de l'origine", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ ORIGINE, nrow = 3) +
  theme_bw()

# La relation semble être affectée par le pays d'origine.

Revenu

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(REVENU)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction du revenu", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ REVENU, nrow = 3) +
  theme_bw()

# La relation semble être affectée par le revenu.

Langue maternelle

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(LANGUE)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction du revenu", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ LANGUE, nrow = 2) +
  theme_bw()

# La relation semble être affectée par la langue maternelle.

Religion

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(RELIGION)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction de la religion", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ RELIGION, nrow = 3) +
  theme_bw()

# La relation semble être affectée par la religion.

Statut matrimonial

ggplot(Base_Trajipaq_Finale_Ok %>% filter(!is.na(VD2_N), !is.na(VI4), !is.na(MATRIMONIAL)), aes(x = VI4, y = VD2_N)) +
  stat_smooth(method = "glm",
              formula = "y ~ x",
              color = "pink", 
              se = FALSE,
              method.args = list(family = binomial)) +
  labs(
    title = "Sentiment d'appartenance et discrimination en fonction du statut matrimonial", 
    x = "Discrimination subie au cours des 12 derniers mois", 
    y = "Sentiment d'appartenance au Canada") +
  facet_wrap(~ MATRIMONIAL, nrow = 3) +
  theme_bw()

# La relation semble être affectée par le statut matrimonial.

H3 : VD3 entretient une relation négative avec VI4

Modèle de régression

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(VD3_N = case_when(
    VD3 == "Non" ~ 0,
    VD3 == "Oui" ~ 1
  ))
reg_3 <- glm(formula = VD3_N ~ VI4, family = "binomial", data = Base_Trajipaq_Finale_Ok)

summary(reg_3)
## 
## Call:
## glm(formula = VD3_N ~ VI4, family = "binomial", data = Base_Trajipaq_Finale_Ok)
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)   1.3078     0.1272  10.281   <2e-16 ***
## VI4           0.6188     0.4067   1.522    0.128    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1347.2  on 1400  degrees of freedom
## Residual deviance: 1344.8  on 1399  degrees of freedom
##   (162 observations deleted due to missingness)
## AIC: 1348.8
## 
## Number of Fisher Scoring iterations: 4
# La relation n'est pas significative avec une chance d'erreur alpha égale à 5%.

H4 : VD1 entretien une relation avec VD3 (en tant que variable indépendante)

Base_Trajipaq_Finale_Ok <-
  Base_Trajipaq_Finale_Ok %>%
  mutate(VD1_F = case_when(
    VD1 < 0.5 ~ "Non",
    VD1 >= 0.5 ~ "Oui"
  ))
ctable(Base_Trajipaq_Finale_Ok$VD3, Base_Trajipaq_Finale_Ok$VD1_F)
## Cross-Tabulation, Row Proportions  
## VD3 * VD1_F  
## Data Frame: Base_Trajipaq_Finale_Ok  
## 
## ------- ------- ------------- ------------- ------------ ---------------
##           VD1_F           Non           Oui         <NA>           Total
##     VD3                                                                 
##     Non           120 (42.9%)   158 (56.4%)    2 ( 0.7%)    280 (100.0%)
##     Oui           458 (37.3%)   759 (61.9%)   10 ( 0.8%)   1227 (100.0%)
##    <NA>            21 (37.5%)    24 (42.9%)   11 (19.6%)     56 (100.0%)
##   Total           599 (38.3%)   941 (60.2%)   23 ( 1.5%)   1563 (100.0%)
## ------- ------- ------------- ------------- ------------ ---------------
chisq.test(Base_Trajipaq_Finale_Ok$VD3, Base_Trajipaq_Finale_Ok$VD1_F)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  Base_Trajipaq_Finale_Ok$VD3 and Base_Trajipaq_Finale_Ok$VD1_F
## X-squared = 2.6917, df = 1, p-value = 0.1009
# La relation n'est pas significative avec une chance d'erreur alpha égale à 5%.